Automatic Text Summarization Berdasarkan Pendekatan Statistika pada Dokumen Berbahasa Indonesia

نویسندگان

چکیده

Abstract—Propelled by the modern technological innovations data and text will be more abundant throughout year. With this much text, automatic summarization is needed now than ever to help summarize a text. Automatic defined as creation of shortened version computer program, product procedure still contains most important points original Statistical approaches one method. There 5 statistical that being used namely aggregation similarity method, frequency location title method (if has title), dan tf-based query doesn’t have title). Cosine calculate tf- based two type validation, user validation system validation. For compare between human summary generated which result in accuracy 76.7647% for with 30% length journal. 82% accuracy. The conclusion on suitable summarization.Keywords: summarization, approaches, Indonesian document, cosine similarity
 Abstrak— Dengan kemajuan teknologi jumlah teks akan semakin melimpah sepanjang tahun. banyaknya ini dibutuhkan bantuan untuk merangkum tersebut. didefinisikan sebagai versi singkat dari suatu menggunakan program komputer yang hasilnya masih memiliki informasi penting berupa gagasan dasar kata atau kalimat dapat merepresentasikan keseluruhan original. Salah satu metode dalam adalah pendekatan statistika. Pendekatan statistika digunakan ada yaitu (bila judul), tidak judul). dipakai perhitungan Validasi dilakukan dengan dua macam validasi. Pertama validasi sistem membandingkan similaritas antara rangkuman manusia, menghasilkan akurasi panjang jurnal Kedua 81%. Kesimpulannya berdasarkan cukup baik maka cocok kasus summarization.Kata kunci: statistika, similarity, dokumen berbahasa Indonesia

برای دانلود باید عضویت طلایی داشته باشید

برای دانلود متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

A survey on Automatic Text Summarization

Text summarization endeavors to produce a summary version of a text, while maintaining the original ideas. The textual content on the web, in particular, is growing at an exponential rate. The ability to decipher through such massive amount of data, in order to extract the useful information, is a major undertaking and requires an automatic mechanism to aid with the extant repository of informa...

متن کامل

Probabilistic Latent Semantic Analysis (PLSA) untuk Klasifikasi Dokumen Teks Berbahasa Indonesia

Abstrak Salah satu pekerjaan yang ada di dalam mengelola dokumen adalah bagaimana menemukan intisari dari dokumen. Topic modeling merupakan teknik yang dikembangkan untuk menghasilkan representasi dokumen berupa kata-kata kunci dari dokumen. Kata-kata kunci tersebut yang akan digunakan dalam proses pengindeksan serta pencarian dokumen untuk ditemukan kembali sesuai kebutuhan pengguna. Pada pene...

متن کامل

Biogeography-Based Optimization Algorithm for Automatic Extractive Text Summarization

    Given the increasing number of documents, sites, online sources, and the users’ desire to quickly access information, automatic textual summarization has caught the attention of many researchers in this field. Researchers have presented different methods for text summarization as well as a useful summary of those texts including relevant document sentences. This study select...

متن کامل

Watermarking pada Video: Robustness, Impercetibility dan Pendekatan untuk Domain Terkompresi

ABSTRAK Meningkatnya penggunaan dokumen digital khususnya multimedia (citra, audio, video) dan kemudahan transmisi data melalui Internet meningkatkan kebutuhan terhadap keamanan data terhadap pelanggaran hak cipta. Watermarking merupakan pendekatan yang telah banyak digunakan dan merupakan bagian dari Digital Right Management (DRM) yang dibuat untuk memenuhi kebutuhan tersebut. Khusus untuk vid...

متن کامل

Automatic Text Summarization

The headline of this paper names a research area originating from the late 50’s but not loosing its popularity until the present time. Moreover, one of the most relevant today’s problems caused by the rapid growth of the Web, which is called information overloading, has increased the necessity of more sophisticated and powerful summarizers. This paper shortly introduces a taxonomy of summarizat...

متن کامل

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ژورنال

عنوان ژورنال: Keluwih

سال: 2021

ISSN: ['2715-6419']

DOI: https://doi.org/10.24123/saintek.v2i1.4045